package com.example.jsoup.kuang.utils;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.net.URL;

/**
 * Created by HMF on 2021/09/27 22:45
 */
public class HtmlParseUtil {

    public static void main(String[] args) throws Exception {  // main函数

        String url = "https://search.jd.com/Search?keyword=java";

        Document document = Jsoup.parse(new URL(url), 5000);

        Element parent_div = document.getElementById("J_goodsList");

        System.out.println(parent_div.html());

        // 获取元素中所有的 li 元素
        Elements lis = parent_div.getElementsByTag("li");

        System.out.println("lis:::::  " + lis);

        int ii = 0;

        /// 获取 li 元素中的内容
        for (Element li : lis) {
            ii++;

            if (ii > 5) { /// 控制输出 5 条数据，这里只是演示就不需要那么多的数据了
                break;
            }

            /// li.getElementsByTag("img")  获取 li 元素里的 img 标签
            /// li.getElementsByTag("img").eq(0)  获取 li 元素里的第一个 img 标签，使用了 eq(0) 方法
            /// li.getElementsByTag("img").eq(0).attr("src");  获取 li 元素里的第一个 img 标签 的 src 属性值
            String img = li.getElementsByTag("img").eq(0).attr("source-data-lazy-img");  /// 获取图片路径

            /// text() 表示获取标签里的文本  如：￥63.2
            String price = li.getElementsByClass("p-price").eq(0).text();

            /// 获取标题
            String title = li.getElementsByClass("p-name").eq(0).text();

            System.out.println("img_path:::  " + img);
            System.out.println("price:::  " + price);
            System.out.println("title:::  " + title);
        }
    }
}
